Recherche d'information. Analyse des résultats de différents systèmes réalisant la même tâche

نویسندگان

  • Claude Chrisment
  • Taoufiq Dkaki
  • Josiane Mothe
  • Sandra Poulain
  • Ludovic Tanguy
چکیده

RESUME: Les systèmes de recherché d’information visent à optimiser les résultats qu’ils fournissent en réponse à une requête de l’utilisateur. Les performances de ces systèmes sont généralement mesurées par rapport à des collections de test communes, comme les collections de TREC (Text REtrieval Conférence). Cette évaluation est réalisée de façon globale, en calculant une moyenne des résultats sur un ensemble de cinquante requêtes. Ainsi, la valeur ajoutée des différentes techniques utilisées par tel ou tel système n’apparaissent pas clairement. Cet article vise à étudier plus finement les résultats obtenus dans une tâche de recherche d’information et répond aux questions suivantes : les requêtes peuvent­elles être classifiées? Y a­t­il une corrélation entre les performances des systèmes sur les différentes requêtes ? La tâche choisie est celle de recherche de passages pertinents et/ou nouveaux. Nous montrons que les variations dans les résultats sont plus corrélées aux outils qu’à leurs différentes versions. ABSTRACT : Information retrieval systems aim at answering users’ needs. Information Retrieval System performances are evaluated using benchmark collections such as TREC (TExt Retrieval Conference) collections. Evaluation is generally based on global evaluation, computing average results over a set of fifty queries. Doing so, the added value of the different techniques used is not easy to show. This paper aims at studying in more details results obtained in a IR task that answers the following questions: can queries be classified? Is there correlation between system performances and queries? The IR task we chose is passage retrieval and novelty detection. We show that variations in results more related to systems than to system versions. MOTS­CLES: Recherche d'information, recherche de passages, détection de la nouveauté, analyse de résultats, typologie de requêtes, analyse factorielle

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Fusion de systèmes pour la recherche de passages dans des textes

RÉSUMÉ Les systèmes de recherche d’information (RI) présentent une grande variabilité dans la liste des documents qu’ils retrouvent en réponse à une même requête. Dans cet article nous étudions l’apport de la fusion des résultats des systèmes pour la RI. Ainsi, nous utilisons les résultats obtenus sur un ensemble de 50 requêtes par différents systèmes qui ont participé à la tâche TREC de sélect...

متن کامل

Distinguer les requêtes pour améliorer la recherche d'information XML

RÉSUMÉ. Cet article s’appuie sur une méthode de recherche d’information dans des collections de documents XML. Cette approche est configurable dans le but de pouvoir s’adapter à différents contextes de recherche. Au regard des résultats obtenus lors de différentes campagnes d’évaluations, l’efficacité de la méthode est inégale d’une requête à l’autre. De plus, différentes configurations de la m...

متن کامل

Analyse des paramètres de recherche d'information: Etude de l'influence des paramètres sur les résultats

Résumé. Cet article présente une analyse détaillée d’un ensemble de 2 millions de résultats de recherche d’information obtenus par différents paramétrages de systèmes de recherche d’information. Plus spécifiquement, nous avons utilisé la plateforme Terrier et l’interface RunGeneration pour créer différentes exécutions (run en anglais) en modifiant les modèles d’indexation et de recherche. Nous ...

متن کامل

PERCIRS: a PERsonalized Collaborative Information Retrieval System

RÉSUMÉ. Pendant que le volume d'information augmente, l'importance de la recherche d’information augmente. La CIR (Collaborative Information Retrieval) est l'une des approches conventionnelles dans les systèmes de recherche d’information. Un système de CIR enregistre les interactions des utilisateurs pour répondre aux questions suivantes plus efficacement. Mais les buts et les caractéristiques ...

متن کامل

Nouvelles perspectives en extraction d'information

Les techniques dites d'extraction d'information (EI) ont connu un essor considérable ces dix dernières années. L'EI consiste à extraire de documents des informations précises et à les structurer sous une forme prédéfinie. Il s'agit en général de remplir des formulaires donnant certaines caractéristiques concernant des entités ou des événements évoqués dans les textes ainsi que des relations ent...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Ingénierie des Systèmes d'Information

دوره 10  شماره 

صفحات  -

تاریخ انتشار 2005